JSAI2026 アルゴリズム的系列学習におけるメモリ拡張ニューラルネットワーク設計の体系的検証
テーマ
外部メモリを持つニューラルネットワーク(MANNs)の設計要素を整理し、系列タスクで体系的に比較する研究
単に系列を予測するのではなく、背後にある「アルゴリズム」を学習できるかに注目する
例: 0と1からなる文字列を渡されてどのようなルールかをかを理解できるか?
系列予測
アルゴリズム推論
系列コピーなど
アルゴリズム推論
基本的には自然言語と同じく Next Token Prediction をやるのだが
難しさ
アルゴリズム学習においてはトークンそのものが意味を持つわけではない
有限個の見本例から操作を同定できない
操作を学習する上で帰納バイアスを与える必要がある
アイデア
系列の各時刻でメモリへの操作とその時刻での出力を予測する再帰NN
フラットメモリ(NTM)、ランダムアクセス型
構造化メモリ ← 採用
Stack: ある時刻での操作を (Push / Pop / 何もしない) の3択に制約できて便利
Queue
挑戦
操作列は離散的な側面
メモリ操作を微分可能にする非自明な設計
重ね合わせ方式
層別化方式
不安定とされているので検証した
設計
コントローラ
RNN / LSTM / MRNN / MLSTM
アクションロジット生成
Liner
High Ordered
正規化手法
Softmax, ...
背景課題
Transformerは自然言語処理では強いが、単純な形式言語や長さ汎化では限界が指摘されている
RNN / LSTMは再帰的な状態更新を持つため、形式言語的なタスクで有利に働く可能性がある
有限の訓練例から一般的な手続きを学ぶには、適切な帰納バイアスが必要になる
ポイント daiiz.icon
外部メモリを単なる容量拡張ではなく、アルゴリズム学習のための構造的バイアスとして扱う
メモリとしてStackやQueueのような古典的データ構造を使う
とり得る操作を制限できて便利
ニューラルネットワークの汎化能力にどう効くか
長さ汎化を見る
「それっぽく学習した」のか「手続きを獲得した」のかを分ける試み
#聴講メモ